热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

捷报|PaddlePaddle助力百度大脑视觉团队获ICME榜单第一

捷报频传,百度大脑再次登上国际舞台。在今年4月初结束的ICME人脸106关键点检测比赛(GrandChallengeof106-pFacialLandm

捷报频传,百度大脑再次登上国际舞台。在今年4月初结束的ICME人脸106关键点检测比赛(Grand Challenge of 106-p Facial Landmark Localization)中,百度大脑视觉技术团队与来自全球的20多个优秀代表队同台竞技,其中包括阿里、华为、美团、中科大等国内视觉技术实力强劲的团队,最终一举摘得桂冠。 

ICME 人脸106关键点检测比赛排行榜

ICME 比赛 TOP3 的相对误差分布示意图

IEEE ICME(IEEE InternationalConference on Multimedia and Expo)是由IEEE Computer Society、Circuits and Systems Society、 SignalProcessing Society以及Communications Society共同主办的计算机多媒体领域最重要的国际会议之一,至今已连续举办18届,涵盖文本分析、图形图像、视频、语音音频等多媒体数据的处理、传输、分析与应用等主题。

 

Grand Challenge of 106-pFacial Landmark Localization则是ICME 2019上举办的四项比赛之一。其测试样本涵盖大姿态、极端表情、遮挡等多种高难度、复杂的情况,且训练样本少,对算法的泛化能力、准确性及鲁棒性等多个方面提出了巨大的挑战,极富学术和实用价值,吸引了来自百度、阿里、华为、美团、中科大等数十个企业和高校的参赛队伍参赛。

据悉,今年比赛主要考验了算法在大姿态、极端表情、遮挡等复杂场景下的鲁棒性和准确性。而百度内部使用的自主研发AutoDL技术——SA-NAS,则能够显著提高算法的鲁棒性和准确性,从而在众多参赛队伍中脱颖而出,获得了第一名的好成绩。

 

SA-NAS是百度凭借在人脸关键点检测领域的长期积累与研究,自主研发的AutoDL技术。它针对比赛任务的特点、以模型精度和结构的多样性为导向,实现了自动化模型构建。并且该方法相比RL-NAS搜索速度提升超过30倍,收敛过程更加稳定,让设计深度神经网络模型摆脱了低效的人工调参困境。此外,百度在算法中引入分割稠密监督、加权热力图监督和多种数据增强方法,充分挖掘小样本训练数据中的特征信息、消除了模型训练中的量化误差。同时,他们以模型结构的多样性为基础、依托检测结果的统计特征,创新地提出了关键点一致性估计算法,从而显著地提升了关键点检测算法准确性与鲁棒性。

 

据悉,在此次竞赛中大放异彩的AutoDL-SA-NAS网络结构自动化设计工具,是基于百度开源深度学习平台PaddlePaddle实现的,已经进入预发布阶段,即将对外正式开源。未来开发者可以通过开放开源的PaddlePaddle平台,针对自己算法研发任务灵活搜索最佳网络结构,获得优于人工调参的模型效果,提高开发效率。此前PaddlePaddle已经开源了基于AutoDL Design的一系列神经网络,以及使用CIFAR10数据在其上训练出来的一共6个模型,包括了网络结构以及对应的权重。每一位开发者都可以很容易使用PaddlePaddle以及公开的CIFAR10数据,在这6个模型上进行推理以及模型融合,获得超过98%的准确率。

 

PaddlePaddle是百度视觉技术团队的主要技术研发平台,是集深度学习核心框架、工具组件和服务平台为一体的技术领先、功能完备的开源深度学习平台。PaddlePaddle在视觉技术上有深厚的积累,官方已开源覆盖分类、检测、语义分割、OCR、GAN、人体关键点检测等类别,基于真实业务场景验证的优质模型。上个月,PaddlePaddle重磅发布了视频识别工具集,覆盖主流实用的序列建模算法与端到端视频识别模型,可一键式任务启动,公开数据集下载,数据预处理,模型训练,模型inference一步到位。

 

PaddlePaddle还对深度学习模型训练中显存占用进行了专项优化。以语义分割Deeplabv3+为例,针对显存消耗分析与解决,冗余前向计算,GPU CPU内存交换,使用16位浮点数等,让开发者可在相同的计算设备上训练更大的模型,还可以在消费级别显卡上完成训练。

 

为了进一步助力开发者进入深度学习领域, 基于PaddlePaddle的一站式深度学习开发平台AI Studio还送出1亿元免费算力,为普通开发者破除算力桎梏。

PaddlePaddle官方支持模型

百度大脑此次拿下ICME人脸106关键点检测比赛冠军,彰显了百度深厚的AI技术实力,也代表着基于PaddlePaddle的百度视觉处理技术将更进一步,未来将持续为各行各业赋能,推动产业智能化发展,为AI领域创造更多可能。

 


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
  • Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本)安装教程 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 技嘉秀高端B450主板:不再支持第七代APU,性价比高且兼容锐龙一代和二代
    在台北电脑展上,技嘉展示了一款高端的B450主板,型号为“b450 aorus pro wi-fi”。该主板具有10+1相供电、散热片覆盖的供电区域和芯片组,以及两个m.2插槽和背部IO挡板。虽然不支持第七代APU bristol ridge,但它兼容锐龙一代和二代,且具有较高的性价比。该主板还配备了音频声卡、Wi-Fi无线网卡等功能,是一款性能出色且设计精良的主板。 ... [详细]
  • 读手语图像识别论文笔记2
    文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1(手语识别背景和方法)一、前言一句:“做完了&#x ... [详细]
  • 关于如何快速定义自己的数据集,可以参考我的前一篇文章PyTorch中快速加载自定义数据(入门)_晨曦473的博客-CSDN博客刚开始学习P ... [详细]
  • Opencv提供了几种分类器,例程里通过字符识别来进行说明的1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。函数原型:训练原型cv ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
author-avatar
Pen-彭静丹h
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有